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摘 要 : 随 着 社交 网 络 的 发 展 ， 融 合 社 交 信 息 的 推荐 系统 在 一 定 程 度 上 解决 了 协同 过 滤 推 荐 系统 的 冷 启动 和 数据 稀 
疏 等 问题 ， 但 是 在 信任 数据 稀疏 情况 下 ， 仍 会 造成 推荐 精度 降低 等 问题 。 为 此 ， 提 出 了 一 种 融合 隐 含 信任 度 和 项 目 
关联 度 的 矩阵 分 解 推荐 算法 。 首 先 ， 利 用 短 阵 分 解 模型 将 信任 数据 进行 分 解 ， 得 到 用 户 的 潜在 被 信任 和 矩阵， 在 此 基 
础 上 引入 用 户 的 影响 力 ， 从 而 提出 了 基于 隐 含 信任 度 的 推荐 模型 ; 然后 ， 为 了 更 好 的 利用 项 目 间 的 关联 信息 ， 反 映 
项 目 间 的 有 向 性 ， 提 出 了 基于 项 目 关联 度 的 推荐 模型 ， 最 后 ， 综 合 两 种 推荐 模型 并 构建 了 一 种 推荐 算法 TCRMF。 
实验 结果 表明 ， 所 提 算 法 在 评分 数据 和 信任 数据 稀 芍 的 情况 下 仍然 可 以 有 效 地 提高 推荐 算法 的 精度 ， 具 有 良好 的 应 
用 前 景 。 
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Matrix factorization recommendation algorithm combing implicit trust and item correlation 


a Li Quan, Xu Xinhua, Liu Xinghong, Lin Song 
| (Collegeof Educational Information & Technology, Hubei Normal University, Huangshi Hubei 435002, China) 


= Abstract: With the development of social network, recommendation system fusing social information sovled the problems 
of cold starting and sparse rating datas of collaborative filtering recommendation system to some extend. Therefore, it still 
caused problems of making recommendation accuracy decline in the case of the sparse trust datas. Thus, this paper proposed 
matrix factorization recommendation algorithm combing implicit trust and item correlation. Firstly, it decomposed the trust 
datas by the matrix factorization model, and obtained the implicit trusted matrix of users. It introduced the influence of users 
on this basis, and proposed the recommendation model based on implicit trust. Secondly, it proposed the recommendation 
model based on item correlation in order to make better use of correlation information between items and reflect on 
orientation between items. Finally, it combined the two kinds of recommendation models, and proposed the TCRMF 
algorithm. The experimental results show that the proposed algorithm still improves the accuracy of recommendation 
algorithm effectively in the conditions that score and trust datas are sparse, and has a good application prospect. 
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factorization 
CO 0 ”引言 解 了 评分 数据 稀 跑 等 问题 ， 但 是 也 带 来 了 一 些 新 的 问题 。 
= 前 ， 大 多 数 基于 社交 网 络 的 信任 度 是 从 用 户 评分 数据 或 者 社 
随 着 网 路 技术 的 不 断 发 展 ， 互 联网 上 的 资源 与 信息 迅速 交 信 任 图 数据 的 角度 进行 度量 。 然 而 ， 在 信任 数据 稀 玻 情况 
的 膨胀 ， 如 何 从 海量 的 数据 中 获取 有 效 的 信息 ， 对 于 普通 用 下 ， 会 造成 推荐 精度 降低 等 问题 。 因 此 ， 如 何在 信任 数据 稀 
户 来 说 是 一 个 巨大 的 挑战 。 解 决 这 类 问题 最 有 效 的 方法 就 朴 的 情况 下 有 效 地 挖掘 用 户 之 间 的 信任 关系 ， 度 量 用 户 之 间 


候 
个 性 化 推荐 系统 。 该 系统 通过 分 析 用 户 的 喜好 ， 为 用 户 推荐 
其 感 兴趣 的 信息 中。 现 有 的 推荐 方法 一 般 可 以 分 为 三 类 : 基 
有 荐 

到 


的 信任 值 成 为 影响 社会 化 推荐 算法 进一步 提高 的 重要 问题 。 

同时 在 人 们 的 生活 中 ， 除 了 用 户 之 间 的 社会 关系 外 ， 物 品 之 

间 也 存在 一 定 的 关联 关系 。 物 品 之 间 这 种 关联 关系 也 会 影响 
四 


于 内 容 的 推荐 方法 所 、 基 于 协同 过 滤 推 荐 方法 9 和 混合 推 


方法 由。 在 这 些 推荐 方法 中 ， 基 于 协同 过 滤 的 推荐 是 应 用 到 用 户 对 物品 的 选择 。 因 此 ， 如 何 获取 物品 之 间 关 联 关系 并 
广泛 的 推荐 方法 。 该 方法 主要 包括 基于 用 户 (user-based) 协 同 ”将 其 应 用 到 推荐 系统 中 是 当前 研究 的 难点 问题 之 一 。 
过 滤 、 基 于 项 目 (item-based) 协 同 过 滤 和 基于 矩阵 分 解 (matrix 为 了 进一步 提高 推荐 算法 的 性 能 。 本 文 提 出 了 一 种 融合 
factorization, MP)5 9 协同 过 滤 等 。 但 它们 通常 面临 着 冷 启 动 、 ” 隐 含 信任 度 和 项 目 关 联 度 的 矩阵 分 解 算法 。 首 先 ， 利 用 和 矩阵 
数据 稀疏 、 算 法 可 扩展 性 差 等 问题 [。 分 解 模型 将 信任 数据 进行 分 解 ,得 到 用 户 的 潜在 被 信任 矩阵 。 
近年 来 ， 随 着 社交 网 络 的 发 展 ， 用 户 之 间 的 信任 关系 作 。 ”接着 , 在 该 矩阵 的 基础 上 引入 用 户 的 影响 力 , 并 以 此 为 基础 ， 
为 社交 网 络 中 一 个 重要 的 信息 ， 为 解决 推荐 系统 中 数据 稀 玻 ”提出 了 局 部 隐 含 信任 度 和 全 局 隐 含 信任 度 的 信任 度量 方法 和 
等 问题 提供 了 依据 外 。 基 于 信任 的 推荐 系统 在 一 定 程度 上 绥 ”相应 的 推荐 模型 。 然 后 ， 为 了 更 好 地 反映 项 目 间 的 关联 关系 
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有 向 性 ， 提 出 了 一 种 基于 项 目 相关 度 和 流行 度 的 推荐 模型 。 b 在 项 目 皮尔 森 相 似 度 的 基础 上 加 入 惩罚 系数 ， 通 过 项 
最 后 ， 综 合 考虑 用 户 隐 含 信任 度 和 项 目 关联 度 的 推荐 模型 并 目 相关 度 和 流行 度 分 别 从 局 部 和 全 局 的 角度 提出 了 项 目 问 关 
提出 相应 的 推荐 算法 。 实 验 结果 表明 ， 本 文 提出 的 算法 与 其 。” 联 关系 的 度量 方法 和 相应 的 推荐 模型 ， 从 而 能 更 好 地 反映 项 
他 社会 化 推荐 算法 相 比 ， 在 均 方 根 误差 等 方面 都 获得 更 加 精 。” 目 间 关联 关系 的 有 向 性 。 
确 的 推荐 结果 。 提出 了 一 种 综合 考虑 用 户 隐 含 信任 度 和 项 目 关联 度 的 
推荐 算法 ， 从 社交 网 络 数据 和 项 目 关联 数据 两 方面 ， 进 一 步 
1 外头 工作 提高 推荐 算法 的 精度 。 
型 的 基于 协同 过 滤 推 荐 算法 通常 面临 冷 启动 、 数 据 稀 Sa 
院 等 问题 。 随 着 社交 网 络 的 快速 发 展 ， 社 交 信 息 为 传统 的 协 。 2。 乱 阵 分 解 模 于 
同 过 滤 算 法 引入 的 新 的 数据 源 。 因 此 ， 越 来 越 多 的 研究 者 研 。 2.1 问题 描述 
究 如 何 利用 社交 信息 来 提升 推荐 系统 的 质量 。Massa 等 人 中 在 推荐 系统 中 含有 由 个 用 户 组 成 的 集合 Late 
首次 提出 基于 信任 的 推荐 系统 ， 他 们 利用 用 户 之 间 的 相似 性 ”各个 项 目 组 成 的 集合 三 (io.…i。} ， 以 及 用 户 对 项 目的 评分 
表示 用 户 之 间 的 信任 值 ， 实 验 结果 表示 基于 信任 的 推荐 系统 矩阵 4-[5].。。 如 果 用 户 立 对 项 目 ;进行 了 评分 ， 则 评分 矩阵 
有 利于 提高 推荐 系统 的 质量 。 王 兴 茂 等 人 (0 提出 了 一 种 基于 ”中 的 元 素 表示 相应 的 评分 值 ， 否 则 ， -0 表示 用 户 « 未 对 
一 跳 信任 模型 的 协同 过 滤 推荐 算法 ， 他 们 在 用 户 评分 信息 基 。。” 项目; 进行 评分 。 在 社交 网 络 中 , 每 一 个 用 户 都 及 ,个 好 友 。 
定义 用 户 直接 和 间接 社会 信任 属性 ， 进 而 计算 用 户 之 闻 。 ，。，，，、、 a 
赵 海燕 等 人 U1 提出 了 基于 信任 传播 的 概 来 矩阵 分 解 算法 ， 他 ”关系 ， 则 社交 关系 撼 阵 中 的 元 素 , 表示 用 户 间 的 信任 强度 ， 
站 在 信任 图 模型 基础 上 定义 了 基于 入 度 的 信任 度量 和 基于 出 ”否则 ，%,=0 表示 用 户 w 和 用 户 v 没 有 社交 关系 。 
入 度 的 信任 度量 等 三 种 信任 度 度量 方法 ， 并 将 它们 融入 到 基 2.2， 低 秩 矩阵 分 解 模型 
于 概率 矩阵 分 解 的 社交 推荐 模型 中 ， 实 验 结果 表明 基于 入 度 为 了 预测 推荐 系统 中 用 户 -项 目 评分 矩阵 ps 的 缺失 值 
的 信任 度量 方法 的 推荐 效果 较 好 。 陈 婷 等 人 0 提出 了 社交 网 矩阵 分 解 模型 通过 降 维 的 方法 将 高 阶 的 评分 矩阵 分解 为 
络 环境 下 基于 信任 的 推荐 算法 ， 他 们 利用 信任 的 传播 性 质 对 。 用户/ 和 项 目 /两 个 低 维 矩 阵 ， 如 式 (D) 所 示 。 
言 任 关系 进行 建 模 ， 在 用 户 评分 数据 的 基础 上 综合 考虑 相似 peu a) 
度 和 信任 度 来 构建 用 户 间 的 偏好 关系 , 验证 了 算法 的 高 效 性 。 其 中 : 《=[L0 JsA ”表示 用 户 特征 矩阵 ，4 表示 用 户 i 
郭 磊 等 人 ua 利用 对 评分 矩阵 进行 概率 矩阵 分 解 得 到 的 潜在 ”的 维 潜在 特征 向 量 。V-[V.h.k,…hJeR” 表示 项 目 特征 扼 
向 量 计算 用 户 与 好 友之 间 的 相似 性 ， 提 高 了 算法 的 精度 。 但 。， 阵 ， 乡 表示 项 目 7 的 大 维 潜在 特征 向 量 。 用 户 ;对 项 目的 预 
是 以 上 这 些 ] < 足 是 当 用 户 评分 数据 瑟 
攻 兴 让 庆 的 村 机 下 全 全 失 让 生生 各 全 的 玖 二 这 生 的 全 任 记 测评 分 可 表示 为 饲 =bg * 将 用 户 原始 评分 与 预测 评分 之 癌 的 
不 能 准确 的 反映 用 户 与 好 友之 间 的 相似 关系 ， 从 而 对 推荐 算 ”误差 的 平方 作为 损失 函数 ， 如 式 (2) 所 示 ， 通 过 最 小 化 损失 函 
法 的 精度 会 产生 不 利 的 影响 。 数 得 到 矩阵 / 和 逢 阵 /。 
除了 用 户 之 间 的 社会 关系 外 ， 物 品 之 间 关联 关系 同样 为 ge a 
协同 过 滤 算 法 引入 了 新 的 数据 源 提供 了 依据 。 因 此 ， 研 究 如 5 名 
何 利用 物品 之 间 的 关联 关系 来 提升 推荐 系统 的 精度 是 当前 研 其中， 六 是 一 个 指示 函数 ， 当 =l 表示 用 户 ; 对 项目/ 打 过 
究 的 重点 问题 。Wu 等 人 (4 通过 标签 信息 来 构造 用 户 和 物品 评分， 否则 =0 。 为 了 防止 过 拟 合 ， 在 式 (2) 的 基础 上 添加 两 
的 相似 性 关系 ,并 将 两 者 融入 PMF 中 提出 基于 近邻 的 概率 矩 ”个 正则 化 项 ， 以 对 参数 进行 约束 ， 如 式 (3) 所 示 。 
降 分 解 模 型 。 杨 兴 包 等 人 3 通过 皮尔 进 相 关 模 型 作为 用 户 和 re i 
物品 的 相似 性 度量 模型 ， 并 通过 Jaccard 系数 对 相似 性 进行 2 全 全 2 2 
这 化 ， 提 出 一 种 综合 用 户 和 项 目 预测 的 协同 过 滤 模型 。 于 美 。 其 中 ; 为 >0 和 为 >0 是 正则 化 参数 ,lwl, 和 Wl 表示 Frobenius 
琪 等 人 ng 分 析 Hownet 等 语义 词典 中 同义词 组 成 的 树 状 结 。 范 数 ， 采 用 随机 梯度 下 降 法 得 到 用 户 特征 矩阵 和 项 目 特征 
构 ， 通 过 计算 物品 之 间 的 距离 、 深 度 和 密度 等 语义 距离 ， 对 ”矩阵 vy ， 并 可 以 准确 的 预测 原 评分 矩阵 Ps 的 缺失 值 。 
物品 进行 基于 语义 相似 的 聚 类 ， 提 出 一 种 融合 社会 网 络 和 物 
品 特征 的 移动 应 用 推荐 。 孙 金刚 等 人 (7 利用 传统 相似 性 计算 。 3 ”出 合 隐 售 信任 度 和 项 目 关联 度 推荐 算法 
方法 得 到 物品 之 间 的 评分 相似 性 ， 同 时 结合 物品 属性 ， 计 算 3.1 基于 隐 含 信任 度 推荐 模型 
物品 的 属性 相似 性 ， 通 过 加 权 因子 得 到 物品 的 最 终 相似 性 ， 在 用 户 评分 数据 或 者 社交 信任 图 数据 稀疏 的 情况 下 ， 根 
提出 一 种 基于 物品 属性 和 云 填充 的 推荐 算法 。 然 而 以 上 这 些 。“ 据 它 们 计算 得 到 的 用 户 之 间 的 信任 度 不 能 准确 的 反映 用 户 与 
:着 算法 不 足 是 物品 之 间 的 相似 关系 都 是 无 向 的 ， 根 据 它们 好 友之 间 的 相似 关系 ,会 对 推荐 算法 的 精度 产生 不 利 的 影响 。 
计算 得 到 的 物品 之 间 的 相关 度 无 法 很 好 的 反映 物品 之 间 真 实 ”为 此 ， 本 节 综合 考虑 了 局 部 隐 含 信任 度 和 全 局 隐 含 信任 度 的 
的 关联 关系 ， 从 而 对 推荐 算法 的 精度 也 会 产生 不 利 的 影响 。 度量 方法 ， 并 提出 了 综合 隐 含 信任 度 的 推荐 模型 。 
针对 以 上 两 点 问题 ， 本 文 提出 了 一 种 融合 隐 含 信任 度 和 3.1.1 局 部 隐 含 信任 度 
项 目 关 联 度 的 矩阵 分 解 推荐 算法 ， 该 算法 的 优势 在 于 由 文献 [18] 分 析 可 知 ， 已 知 用 户 的 信任 关系 矩阵 8 ， 通 
中 利用 矩阵 分 解 模型 将 信任 数据 进行 分 解 ， 得 到 用 户 的 ”过 低 秩 矩 阵 分 解 模型 对 该 矩阵 进行 分 解 ， 得 到 用 户 的 信任 者 
潜在 被 信任 甜 阵 ， 并 在 此 基础 上 引入 用 户 的 影响 力 ， 提 出 了 特征 矩阵 8 和 被 信任 者 特征 矩阵 。 如 式 (所 示 。 
局 部 和 全 局 隐 含 信任 度 的 度量 方法 和 相应 的 推荐 模型 ， 从 而 Say (4) 
在 一 定 程度 上 解决 了 信任 数据 稀疏 情况 下 推荐 精度 降低 等 问 其中， 8-[8.8..8,…8,1e R” 表示 用 户 的 信任 者 特征 矩阵 ，4 
题 ， 示 用 户 1 作为 信任 者 的 4 维 潜在 特征 向 量 。 
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义 =[ 尼 , 沙 , 办 … 炒 ]sAp” 表示 用 户 的 被 信任 者 特征 矩阵 ，% 表示 隐 含 信任 度 计 算得 到 的 用 户 之 间 的 信任 度 能 更 加 准确 的 反映 


用 户 作为 被 信任 者 的 4 维 潜在 特征 向 量 。 用 户 i 与 用 户 j 的 


预测 信任 强度 可 表示 为 % =B&r1 。 将 用 户 之 间 原 始 信任 强度 与 
预测 信任 强度 之 间 的 误差 的 平方 作为 损失 函数 ， 如 式 (5) 所 
示 ， 通 过 最 小 化 损失 函数 得 到 和 矩阵 8 和 和 矩阵/ 。 

fi(5,B,W)= > D4, -BW) (5) 
其 中 : 三 是 一 个 指示 函数 ， 当 石 =1 表 示 用 户 ;与 用 户 了 存在 
言 任 关系 ， 否 则 方 =0 。 为 了 防止 过 拟 合 ， 在 式 (5) 的 基础 上 添 


加 两 个 正则 化 项 ， 以 对 参数 进行 约束 ， 如 式 (6) 所 示 。 
FS,BW) = Yh, -Wy+le + WE (0) 
则 化 参数 ，|8l; 和 Wl; 表示 Frobenius 


范 数 。 采 用 随机 梯度 下 降 法 优化 上 式 ，8 、w 的 求 导 公式 如 
式 (7) 和 (8) 所 示 。 


其 中 为 >0 和 为 >0 是 正 


of n 
B86 2S WSN +h8, (7) 


a 
= P10 -5)8 ta (8) 


用 户 与 好 友之 间 的 相似 关系 。 因 此 ， 综 合 两 种 隐 含 信任 度 并 
提出 了 相应 的 推荐 模型 ， 该 模型 如 式 (12) 所 示 。 


1 a 2 g 
FR DL TYR VV t+ 
2 宇 j=l 2 2 
— ee 1l—-a 
EPS UE ES -ol 


其 中 : $57 表示 用 户 i 的 社会 好 友 关 系 集合 。 参 数 4 控制 用 户 
的 局 部 隐 含 信任 度 和 全 局 隐 含 信任 度 对 推荐 算法 的 影响 。 

3.2 基于 项 目 关 联 度 推荐 模 
项 目 之 间 的 关联 关系 在 推荐 系统 中 是 影响 用 户 决 策 的 
要 因素 之 一 。 本 文 从 项 目的 相关 度 和 流行 度 的 角度 对 项 
行 建 模 。 
3.2.1 项 目 相关 度 
通常 度量 项 目 相 似 性 的 皮尔 森 相 似 度 或 者 余弦 相似 度 具 
有 对 称 性 ， 即 项 目 ? 和 项 目 4 的 相似 性 Simp,q) 等 于 
Sim(q,p) 20。 然 而 在 实际 生活 中 ， 为 考虑 项 司 相 互 影响 
的 差异 性 ， 项 目 和 项 目 4 相似 性 与 项 目 4 和 项 目 P 的 相似 
性 是 不 同 的 。 因 此 为 了 准确 的 描述 项 目 间 的 关联 关系 ， 在 不 
考虑 其 他 项 目 相关 信息 的 情况 下 ， 通 过 对 皮尔 森 相 似 性 加 入 


(12) 


Le 


尝 Im 
mm 


通过 和 矩阵 分 角 算法 将 每 一 个 用 户 映 射 为 信任 者 的 特征 向 
量 8 和 被 信任 者 的 特征 向 量 和 。 由 文献 [19] 分 析 可 知 ， 在 社 
I 络 中 ， 用 户 的 影响 力 越 大 ， 那 么 该 用 户 就 越 容易 受到 其 
也 用 户 的 信任 。 因 此 通过 用 户 的 被 信任 者 的 特征 向 量 引 入 用 
户 的 影响 力 ， 如 式 (9) 所 示 。 


Influence(i)=NW W (9) 
让 i 的 被 信任 者 特征 向 量 。 用 户 之 间 的 信任 关 


虽 


< 
1 图， 


一 > 


其 中 :为 用 


系 是 非 对 称 的 ， 例 如 你 对 好 友 的 信任 程度 与 好 友 对 你 的 信任 
程度 是 不 同 的 。 所 以 为 了 准确 地 度量 用 户 之 间 不 同 的 信任 关 
系 ， 引 入 局 部 隐 含 信任 度 ， 如 式 (10) 所 示 。 
, .Influcence()) 
Sear (i) > Influcence(k) (10) 


中 : 1mnfucence( 站 表示 好 友 ji 影响 力 ，WN, 表示 用 户 i 的 好 友 
合 。 好 友 /的 影响 力 越 大 ， 该 用 户 越 容 受到 用 户 i 的 信任 ， 
影响 力 大 的 好 友 对 用 户 的 作用 越 大 。 

3.1.2 全 局 隐 含 信任 度 
文献 [12] 分 析 可 知 ， 全 局 信任 度 表示 用 户 在 社会 网 络 
中 的 的 信任 参考 了 其 他 所 有 节点 对 其 的 综合 评价 ， 即 用 户 在 
整个 社交 网 络 中 的 可 靠 性 和 影响 力 。 为 了 从 全 局 角度 度量 用 
户 之 间 的 信任 关系 ， 引 入 全 局 隐 舍 信任 度 ， 如 式 (11) 所 示 。 


ym 
| 沿 /人民 
y 


meereet) 一 Mean(y， Influcence(k)) 
Sopa (@) Sl 


8 (11) 
Max(>， Influcence(k))— Min(> Influcence(k)) 


其 中 :nflucencel(i) 表示 用 户 i 的 影响 力 ; Mean(Y, Influcence(k)) 表 
k=1 


示 社 交 网 络 中 所 有 用 户 影 响 力 的 均值 ; Mar， Influcence(k)) 表 


示 影 响 力 的 最 大 值 ; Mi Imfiucence() 表示 影响 力 的 最 小 值 。 


在 社交 网 络 中 ， 用 户 的 影响 力 越 大 ， 该 用 户 在 社交 网 络 中 
的 全 局 信任 度 越 大 ， 越 会 受到 更 多 人 的 信任 。 
3.1.3 综合 隐 含 信任 度 推荐 模型 

在 信任 数据 稀疏 的 情况 下 ， 根 据 局 部 隐 含 信任 度 和 全 


可 


惩罚 系数 ， 项 目 对 项 目 4 的 相关 度 如 式 (13) 所 示 。 


IN, ON,| 
AA 


vai(P,q) = 


Sim( p,q) (13) 


其 中 :， |,| 表示 项 


? 在 推荐 系统 中 对 项 目 P 进行 评分 的 用 


户 数 , |N,| 表 示 项 目 4 在 推荐 系统 中 对 项 目 4 进行 评分 的 用 户 


数 。 参 数 7 为 惩罚 因子 ， 通 常 取 值 范围 为 Ye(0.5,1) ， 实 现 项 
目 之 间 关 联 关系 的 有 向 性 。Sim(p,gq) 表示 项 目 间 的 皮尔 森 相 似 


3.2.2 项 目 流行 度 
项 目 流 行 度 是 从 全 局 角度 表示 某 项 目 在 所 有 项 目 集中 流 
行程 度 。 推 荐 系统 中 项 目的 流行 度 一 般 具 有 较 大 的 差异 性 ， 
从 项 目的 流行 度 可 以 推断 用 户 对 未 评分 项 目 感 兴 趣 的 可 能 
性 。 项 目的 流行 度 越 高 ， 用 户 对 未 评价 项 目 感 兴趣 的 可 能 性 
越 大 。 由 文献 [21] 分 析 可 知 ， 项 目的 流行 度 与 浏览 过 该 项 目 
的 用 户 数 量 成 正比 ， 并 且 在 计算 每 个 项 目的 流行 度 时 进行 向 
量 标准 化 ， 如 式 (14) 所 示 。 


IN,| 


W,,,(p) = 
ee E 14 
Ji 04) 


pel 


其 中 :|N,| 表示 对 项 目 P 进行 评分 的 用 
目的 
3.2.3 


户 数 ， /了 表示 所 有 项 


合 。 

综合 关联 度 推 荐 模型 

项 目 相 关 度 从 局 部 角度 获取 项 目 间 的 有 向 关联 关系 ， 项 
目 流 行 度 从 全 局 的 角度 对 该 关系 进行 修正 ， 以 更 加 准确 的 反 
映 项 目 间 关 联 度 。 因此, 提出 了 一 种 综合 关联 度 的 推荐 模型 ， 
该 模型 如 式 (15) 所 示 。 


3 9 t+ 
i nt 

DN es py a 
2 2 jj 


其 中 : Ki 表示 项 目 i 紧密 关联 的 项 目 集合 。 参 数 8 控制 着 项 
目的 相关 度 和 项 目 流行 度 对 推荐 算法 的 影响 。 


(RVUV)= 


A 
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基于 隐 含 信任 度 推荐 模型 从 社交 网 络 角度 分 析 用 户 间 的 


信任 度 来 提升 推荐 系统 精度 ， 而 基于 项 目 关 联 度 推荐 模型 从 


项 


间 关 联 关系 角度 分 析 项 目 间 的 关联 度 来 提升 推荐 系统 精 


度 。 


因此 ， 综 合 考虑 两 种 方法 ， 提 出 融合 隐 含 信任 度 和 项 
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3.3 融合 隐 含 信任 度 和 项 目 关 联 度 推荐 模型 


of |、 本 re 
计算 偏 导 数 包 和 3 的 时 间 复杂 度 为 ooFd) ， 计 算 偏 导数 


共和 让 的 时 间 复杂 度 都 为 Oorb 。 由 于 7 、F7 、4 和 的 
值 都 比较 小 ， 因 此 偏 导数 的 计算 也 是 比较 快 的 ， 且 与 总 的 用 


关联 度 的 推荐 模型 ， 该 模型 如 式 (16) 所 示 。 


n 


i a 
FRU =I DD UV +E t+ 
1 


品 


i=1 /= 


SEs 000 Es ke 0) 


GE Eno | 


三 


3.4 


表示 项 目的 关联 关系 对 推荐 算法 的 影响 。 采 用 随机 梯度 下 降 
法 优化 上 式 ，v、v 的 求 导 公式 如 式 (17) 和 (18) 所 示 。 


ph: 参 数 o 表 示 用 户 的 社会 关系 对 推荐 算法 的 影响 ,参数 P 


= (17) 
b> Soa oD) (VU)+ (0) D Ss)(U, — 2 
人 =D Rt,t 
> (18) 


p(BS kat DY —V)+(1— 四 YAO 人 -)] 


算法 描述 
融合 隐 含 信任 度 与 项 目 关联 度 的 矩阵 分 解 推荐 算法 


(TCRMPE) 步 骤 如 下 : 


数 d 


学 习 率 4 和 K, ， 最 大 达 代 次 数 L 和 工 ，。 


输入 : 用 户 - 项 目 评分 矩阵 &_ ， 用 户 - 用 户 社交 矩阵 9 ， 潜 在 特征 维 
和 ,正则 化 系数 入 和 和 、 超 参数 a 、h  、o 和 PP， 惩罚 因子 7， 


输出 : 信任 者 的 特征 矩阵 8 ,被 信任 者 的 特征 矩阵 Ww 。 用 户 特征 逢 


阵 / 和 项 目 特征 矩阵 。 


和 条 
O(n 


户 数 量 ， d,k 分 别 表 示 算 法 的 维度 ， 


begin 
1.for 1 <L do: 
eh wh 
2 BB, Wel- ; 
'08, 3 这 Gf 
3. 1=l+l; 
4.end for 


5. 根据 式 (9)， 计 算 用 户 i 影响 力 Influence(i) ; 
6. 根据 式 (10)， 计 算 用 户 i 和 用 户 j 的 局 部 隐 含 信任 度 Si (i,j); 
7 根据 式 (11)， 计 Pi 全 局 隐 含 信 任 度 S giobal (@) 日 
8 
9 


. 根据 式 (13)， 计 算 项 目 P 对 项 目 4 的 相关 度 信 ,i(p,9); 
. 根据 式 (14)， 计 算 项 目 P 流行 度 如 mw(P) ; 
10.for Ll, <L, do: 


11. 局 < 以 Rs < -A 
12. L=L+t; 

13.end for 

end 


TCRME 算法 的 时 间 复 杂 度 主要 是 根据 目标 函数 fh、 记 
目 应 偏 导数 的 求解 来 计算 的 。 目 标 函 数 /的 时 间 复 杂 度 是 
友 ) 。 目 标 函 数 户 的 时 间 复 杂 度 是 Com) 。 其 中 ， 半 表示 用 
表示 用 户 平均 信任 关 


i | 


系数 量 ，z 表示 用 户 平均 评分 数量 。 由 于 信任 和 评分 数据 比 
较 稀 朴 ，7、7 、d 和 的 值 都 比较 小 ， 因 此 ,目标 函数 和 
五 的 计算 是 比较 快 的 , 且 与 总 的 用 户 数 量 4 成 线性 正比 关系 。 


户 数量 也 成 线性 正比 关系 。 所 以 目标 函数 和 梯度 计算 的 时 
间 复 杂 度 是 Coz+na+nz2d) 。 该 算法 的 时 间 复 杂 度 主要 是 受 
用 户 数 量 4 的 影响 ， 因 此 该 算法 可 以 应 用 与 大 规模 数据 集 。 


4 ”实验 结果 和 分 析 


本 节 主 要 介绍 TCRMF 算法 与 其 他 相关 算法 对 推荐 结果 
的 影响 。 首 先 介绍 实验 采用 的 数据 集 和 评价 方法 ， 然 后 设计 
4 组 实验 从 不 同 的 角度 对 比分 析 本 文 算法 的 性 能 。 
4.1 数据 集 

为 了 比较 不 同 信息 对 推荐 结果 的 影响 ， 文 本 选择 了 两 种 
公开 数据 集 进行 算法 测试 ， 
Epinions(http://www.trustlet.org/epinions.html 和 
Ciao(http://www.cse.msu.edu/~tangjili/trust.html)。 这 两 个 数据 
集 都 同时 包含 了 用 户 评分 信息 和 社交 关系 信息 。 两 个 数据 集 
的 详细 统计 特性 如 表 1 所 示 。 

表 1 两 个 数据 集 统计 特性 


Table 1 Statistic of the two data sets 


数据 集 Epinions Ciao 
户 数 量 31625 15375 
项 目 数量 141368 106797 
评分 数量 583960 384086 
社交 关系 数量 342033 151780 


4.2 评价 标准 

为 了 评价 推荐 算法 的 性 能 , 本 文 使 用 平均 绝对 误差 (mean 
absolute error，MAE) 和 均 方 根 误差 (root mean squared error， 
RMSE)。 这 两 种 评价 指标 通过 计算 真实 评分 与 预测 评分 之 间 
的 误差 来 衡量 推荐 结果 的 准确 性 ， 它 们 的 值 越 小 ， 推 荐 的 精 


度 就 越 高 。 两 种 评价 指标 的 计算 公式 如 式 (19) 和 (20) 所 示 。 


MAE=L > 


(DT 


局 (9) 


(20) 


其 中 : X 表示 测试 集中 评分 的 数量 ，7 表示 测试 集 
真实 评分 值 ， R, 表示 预测 评分 值 。 


4.3 实验 结果 分 析 

为 了 验证 TCRME 算法 的 预测 准确 率 ， 将 它 与 矩阵 分 解 
算法 (MF)、Jamali 等 人 2 提出 基于 信任 传播 的 社会 化 推荐 算 
法 (SocialMF) 和 Ma 等 人 D] 提 出 的 基于 社会 正则 化 的 推荐 算 
法 (SoReg) 进 行 比 较 。 

实验 1 不 同 特征 向 量 维度 下 的 实验 分 析 

本 实验 比较 了 各 种 算法 在 Epinions 和 Ciao 数据 集 的 测试 
结果 。 对 于 所 有 基于 矩阵 分 解 的 推荐 算法 ， 分 别 设置 潜在 特 
征 维 数 为 5 和 10， 并 验证 各 种 算法 的 精度 。 实 验 结果 如 表 2 
和 3 所 示 。 

a)SocialMF 和 SoReg 算法 的 MAE 值 和 RMSE 值 都 要 小 
于 MF 算法 ， 推 荐 精度 有 了 一 定 的 提高 。 这 说 明 社 交 信 息 有 
助 于 提高 传统 矩阵 分 解 推荐 算法 的 预测 精度 。 
b) 本 文 的 TCRMF 算法 相 比 于 SocialMF 和 SoReg 的 社会 
化 推荐 算法 ,在 MAE 值 和 RMSE 值 上 又 有 了 进一步 地 提升 。 


Rj 表示 
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这 说 明 在 社交 信息 基础 上 融合 项 目 关联 信息 又 可 以 进一步 提 合 项 目的 关联 数据 有 助 于 提高 算法 的 精度 。 
高 推荐 算法 的 预测 精度 。 b) 在 信任 数据 稀疏 (信任 数据 <15) 的 情况 下 ，TCRMEF 算 
表 2 Epinions 数据 集 实验 结果 法 要 明显 优 于 其 他 基于 社交 信息 的 推荐 算法 。 这 表明 对 信任 
Table 2 ” Experimental result of Epinions 数据 进行 矩阵 分 解 ， 通 过 综合 局 部 隐 含 信任 度 和 全 局 隐 含 信 
Metrics MF SocialMF SoReg TCRMF 任 度 的 推荐 模型 能 有 效 的 提 高 社会 化 推荐 人 和 法 的 精度 。 
MAE 0.942 0.893 0.871 和 大 
0.801 二 
LImprove 14.9% 10.3% 8.1% ‘op 中 > 二 
RMSE 1.261 1.135 1.151 | 人 sa 
1.023 8 和 TI 106 全 > 
Improve 18.9% 9.9% 11.1% 二 | A iio a 
MAE 0.902 0.863 0.851 1 = | 得 sa 
0.791 党 
el Improve 12.3% 8.3% 7.1% i 
RMSE 1.192 1.107 1.091 i 1 
1.013 | 绚 Ww 1 ~ 全 wm F100 >100 
Improve 15% 8.5% 7.1% 
表 3 Ciao 数据 集 实验 结果 (a) Epinions 数据 集 (b) Ciao 数据 集 
Table 3 Experimental result of Ciao 到 2 不 同 信任 稀疏 度 下 rmse 对 比 实验 
Metrics MF SocialMF SoReg TCRMF Fig.2 Comparsion on RMSE with different trust sparsity 
MAE 0.905 0.861 0.856 实验 4 不 同 项 目 关联 关系 的 实验 分 析 
mde 1 a 为 了 评估 不 同 项 目 关联 度 的 计算 方法 对 推荐 算法 精度 的 
RMSE 102 1003 0996 影响 。 首 先 根据 皮尔 森 相 似 度 计算 项 目 间 的 关联 度 ， 并 将 项 
apg. i a 目的 无 向 关联 关系 与 MF 结合 得 到 改进 的 推荐 算法 UCMF。 
MAE 0.872 0.834 0.823 然后 根据 本 文 提出 的 项 目 关联 关系 度量 方法 计算 项 目 间 的 关 
Improve 123% 83% 7% 6 联 度 ， 并 将 项 目的 有 向 关联 关系 与 MF 结合 得 到 改进 的 推荐 
= RMSE 1.021 0.975 0.984 算法 DCMF。 最 后 比较 两 种 改进 算法 在 Epinions 和 Ciao 数 
Improve 11.6% 74% g2% 3 据 集 的 测试 结果 。 分 别 设置 潜在 特征 维 数 为 5 和 10， 并 计算 
实验 2 不 同 评分 稀 踊 度 的 实验 分 析 两 种 算法 的 RMSE 值 。 实 验 结 果 如 表 4 所 示 。 
为 了 测试 不 同 评分 稀疏 度 下 的 各 种 算法 的 效果 。 将 不 同 表 4 关联 关系 对 rmse 的 影响 


评分 数量 划分 为 0~20、21~50、51~100、101~300、301~500 


和 500 以 上 一 共 6 组 ,分 别 统计 Epinions 和 Ciao 两 个 数据 集 
的 RMSE 值 ， 实验 结 吉 果 如 图 1 所 示 。 
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息 。 当 ws(0D 时 , 算法 综合 考虑 
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E 荐 精度 先 增加 是 
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算法 的 影 
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目的 相关 度 和 流行 度 信息 ， 随 着 6 值 
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图 3(c) 可 知 ， 随 着 o 值 的 增加 ， 用 户 的 社会 关系 在 TCRMF 
算法 所 占 比重 逐渐 增加 , 推荐 精度 先 增加 再 减少 。 当 o=0.1 时 ， 
和 法 取得 较 好 的 推荐 精度 。 

d) 参 数 P 表示 着 项 目的 关联 关系 对 推荐 算法 的 影响 。! 
图 3(d) 可 知 ， 随 着 2 值 的 增加 ， 项 目的 关联 关系 在 TCRMF 
算法 所 占 比重 逐渐 增加 ， 推 荐 精度 也 是 先 增加 再 减少 。 当 
P=0.1 时 ， 算 法 的 推荐 精度 最 好 。 


wr 
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水 
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(a) 参 数 2 (b) 参 数 PB 
(Cc) 参数 和 (dd) 参数 2 


图 3 参数 对 RMSE 的 影响 
Fig.3 Impact of parameters on RMSE 
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本 文 提出 了 一 种 融合 隐 含 信任 度 和 项 目 关联 度 的 矩 陪 
解 算法 。 利 用 矩阵 分 解 模型 将 信任 数据 进行 分 解 ， 得 到 用 
的 潜在 被 信任 矩阵 ， 并 在 此 基础 上 引入 用 户 的 影响 力 ， 提 昌 
种 综合 局 部 隐 含 信任 度 和 全 局 的 隐 含 信任 度 的 推荐 模型 。 
该 模型 提高 了 对 于 信任 数据 稀疏 时 推荐 系统 的 精度 。 为 考虑 
项 目 间 相互 影 差异 性 ， 在 项 目 皮尔 森 相 似 度 的 基础 上 加 
入 惩罚 系数 引入 项 目的 相关 度 ， 同 时 从 全 局 的 角度 考虑 项 目 


I 池 


EE 


I 


EIy 
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的 流行 度 对 项 其 度 进行 修正 ， 提 出 了 一 种 综合 关联 度 推 
荐 模型 ， 该 模型 可 以 在 不 借助 项 目 其 他 外 部 信息 的 基础 上 更 
好 的 反映 了 项 目 间 的 有 向 关系 。 实 验 结果 表明 ， 本 文 所 提 算 
法 对 于 稀 疏 的 信任 数据 要 优 于 与 现 有 的 社会 推荐 算法 ， 同 时 
在 社交 信息 基础 上 融合 项 目 关联 信息 又 可 以 进一步 提高 推荐 
算法 的 预测 精度 ， 取 得 更 加 明显 的 效果 。 在 今后 的 工作 中 ， 
笔者 将 把 重点 放 在 如 何 将 地 理 位 置 等 情景 信息 融入 本 文 的 
荐 模型 中 来 预测 目标 用 户 对 项 目的 喜好 ， 以 期 更 好 地 提高 该 
E 荐 算法 的 精度 。 
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